ตัวอย่างที่ 2 ของ เหตุผลวิบัติโดยอัตราพื้นฐาน

เจ้าหน้าที่ตำรวจมีเครื่องวิเคราะห์ลมหายใจ (สำหรับตรวจจับคนเมา) ที่แสดงว่าเมาอย่างผิดพลาดใน 5% ของผู้ขับรถที่ไม่เมา แต่ว่า เครื่องวิเคราะห์ลมหายใจไม่เคยพลาดที่จะจับคนเมาจริง ๆ มีคนขับรถ 1 ใน 1,000 ที่ขับรถเมื่อเมา สมมุติว่า เจ้าหน้าที่หยุดรถโดยสุ่ม แล้วบังคับใช้เครื่องวิเคราะห์ลมหายใจกับคนขับ และเครื่องแสดงว่าคนขับเมา ถ้าสมมุติว่า เราไม่รู้ข้อมูลอย่างอื่นเลยเกี่ยวกับคนขับ มีความน่าจะเป็นสูงเท่าไรที่คนขับจะเมาจริง ๆ

คนเป็นจำนวนมากจะตอบว่า มีความน่าจะเป็นสูงถึง 95% แต่ว่าความน่าจะเป็นจริง ๆ อยู่ที่แค่ 2%

เพื่อที่จะหาคำตอบที่ถูกต้อง เราควรจะใช้ Bayes' theoremจุดมุ่งหมายก็คือเพื่อที่จะหาค่าความน่าจะเป็นว่าคนขับเป็นคนเมาเมื่อเครื่องวิเคราะห์ลมหายใจแสดงว่าคนขับเมา เมื่อหยุดคนขับรถโดยสุ่ม ซึ่งสามารถเขียนได้ว่า

p ( d r u n k | D ) = p ( D | d r u n k ) p ( d r u n k ) p ( D ) {\displaystyle p(drunk|D)={\frac {p(D|drunk)\,p(drunk)}{p(D)}}}

ซึ่งเราได้ข้อมูลจากบทความตัวอย่างว่า

p ( d r u n k ) = 0.001 {\displaystyle p(drunk)=0.001} คือค่าความน่าจะเป็นว่าคนขับเมา (คือ 1/1000) p ( s o b e r ) = 0.999 {\displaystyle p(sober)=0.999} คือค่าความน่าจะเป็นว่าคนขับไม่เมา (คือ 999/1000) p ( D | d r u n k ) = 1.00 {\displaystyle p(D|drunk)=1.00} คือความน่าจะเป็นว่าเครื่องวิเคราะห์จะแสดงว่าคนขับเมา ถ้าคนขับเมา p ( D | s o b e r ) = 0.05 {\displaystyle p(D|sober)=0.05} คือค่าความน่าจะเป็นว่าเครื่องวิเคราะห์จะแสดงว่าคนขับเมา ถ้าคนขับไม่เมา

ดังที่เราเห็นได้จากสูตร ถ้าเราต้องการคำตอบ เราจะต้องหาค่า p (D) คือค่าความน่าจะเป็นที่เครื่องวิเคราะห์จะแสดงว่าคนขับเมาเมื่อหยุดคนขับโดยสุ่มโดยที่ไม่รู้ว่าคนขับเมาหรือไม่เมา ซึ่งหาได้จากค่าที่บอกมาแล้วดังนี้

p ( D ) = p ( D | d r u n k ) p ( d r u n k ) + p ( D | s o b e r ) p ( s o b e r ) {\displaystyle p(D)=p(D|drunk)\,p(drunk)+p(D|sober)\,p(sober)}

ซึ่งได้

p ( D ) = 0.05095 {\displaystyle p(D)=0.05095}

เมื่อใส่ค่านี้ลงในสูตรแรก ก็จะได้

p ( d r u n k | D ) = 0.019627 ⋅ {\displaystyle p(drunk|D)=0.019627\cdot }

คำอธิบายที่อาจจะเห็นได้ง่ายกว่าอย่างหนึ่งก็คือ โดยเฉลี่ยแล้ว สำหรับคนขับทุก ๆ 1000 คนที่หยุดตรวจ

  • คนขับ 1 คนจะเมา และเครื่องวิเคราะห์จะจับว่าเมาได้ 100% ดังนั้น จะมี 1 คนที่จับได้ว่าเมาอย่างถูกต้อง
  • คนขับ 999 คนจะไม่เมา และจากคนเหล่านั้น 5% จะจับได้ว่าเมาอย่างผิดพลาด และดังนั้นจะมีคน 49.95 คนถูกจับว่าเมาอย่างผิด ๆ

และดังนั้น ในบรรดาคน 1,000 คนที่เครื่องวิเคราห์ะบอกว่าเมาคือ 50.95 คน จะมีคนเมาจริง ๆ 1 คน และดังนั้นความน่าจะเป็นที่จะตรวจจับคนเมาโดยสุ่มได้จริง ๆ คือ p ( d r u n k | D ) = 1 / 50.95 ≈ 0.019627 {\displaystyle p(drunk|D)=1/50.95\approx 0.019627}

แต่ว่า ความถูกต้องของคำตอบนี้ขึ้นอยู่กับข้อสมมุติเบื้องต้นว่า เจ้าหน้าที่หยุดรถโดยสุ่มจริง ๆ ไม่ใช่เพราะขับรถไม่ดีแต่ว่า ถ้าใช้การขับรถไม่ดี (หรือเหตุผลอย่างใดอย่างหนึ่งอื่น) เป็นเหตุผลในการหยุดรถ การคำนวณก็จะต้องรวมเอาค่าความน่าจะเป็นของคนเมาขับรถดีไม่ดี และคนไม่เมาขับรถดีไม่ดีเข้าไปด้วย

ใกล้เคียง

เหตุผลวิบัติ เหตุผลวิบัติของนักการพนัน เหตุผลวิบัติในการวางแผน เหตุผลวิบัติโดยอัตราพื้นฐาน เหตุผล เหตุผลวิบัตินักแม่นปืนชาวเท็กซัส เหตุผลวิบัติเพราะการคืนสภาพ เหตุผลวิบัติโดยอุดมคติเพ้อฝัน เหตุผลวิบัติโดยหลักฐานไม่สมบูรณ์ เหตุผลวิบัติไฟไหม้ฟาง

แหล่งที่มา

WikiPedia: เหตุผลวิบัติโดยอัตราพื้นฐาน http://ipdas.ohri.ca/IPDAS-Chapter-C.pdf http://www.eeps.com/riskicon/ http://www.youtube.com/watch?v=D8VZqxcu0I0 http://library.mpib-berlin.mpg.de/ft/uh/UH_Represe... http://www.researchgate.net/profile/Ulrich_Hoffrag... //doi.org/10.1016%2F0001-6918(80)90046-3 //doi.org/10.1016%2F0010-0277(95)00664-8 //doi.org/10.1037%2Fh0034747 //dx.doi.org/10.1002%2F14651858.CD006776.pub2 //dx.doi.org/10.1002%2Facp.1460